7月25日,阿里阿里巴巴全新开源千问3推理模型,连发连夺性能大幅提升,项第WhatsApp%E3%80%90+86%2015855158769%E3%80%91reco%20hoist%20ltd一举夺下「全球最强开源模型」王座,阿里比肩顶级闭源模型Gemini-2.5 pro、连发连夺o4-mini。项第本周阿里已连续开源3款重磅模型,阿里分别斩获基础模型、连发连夺编程模型、项第推理模型等主流领域的阿里WhatsApp%E3%80%90+86%2015855158769%E3%80%91reco%20hoist%20ltd三项全球开源冠军。两天前开源的连发连夺AI编程模型Qwen3-Coder,更是项第引爆全球AI圈,掀起一波用中国千问开源模型替代闭源模型的阿里新浪潮。

最新推出的连发连夺千问3推理模型,登顶全球最强开源推理模型。项第?自千问3旗舰模型Qwen3-235B-A22B发布后,阿里通义团队一直在扩展大模型的推理极限,全新开源的千问3推理模型在通用能力和深度思考能力上实现巨大飞跃。千问3推理模型支持256K上下文长度,在知识(SuperGPQA)、编程(LiveCodeBench v6)、数学(AIME25)、人类偏好对齐(Arena-Hard v2)、创意写作(WritingBench)、多语言能力(MultilF)等核心能力上,千问3推理模型完全可比肩Gemini-2.5 pro、o4-mini等顶尖闭源模型,并创下全球开源模型的最佳性能表现。?

阿里AI三连发,连夺三项第一!

在经典基础模型领域,千问3全球最强。3天前开源的Qwen3-235B-A22B-Instruct-2507(非思考版)新模型,性能显著提升,在GPQA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超越Claude4(Non-thinking)等领先闭源模型。权威AI研究机构Artificial Analysis指出,“千问3是全球最智能的非思考基础模型”。

?

阿里AI三连发,连夺三项第一!

在AI编程领域,新开源的Qwen3-Coder被誉为「全球最好的编程模型」。Qwen3-Coder在代碼能力及Agent調用能力方面取得重大突破。在多語言SWE-bench、Mind2Web、Aider-Polyglot等模型Agent能力評估中,Qwen3-Coder超越GPT4.1、Claude4等頂級閉源模型,并登頂全球最大AI開源社區HuggingFace?模型總榜冠軍。借助Qwen3-Coder,剛入行的程序員一天就能完成資深程序員一周的工作,生成一個品牌官網最快只需5分鐘。

Qwen3-Coder的开源,引爆硅谷科技圈,在全球AI圈掀起一波「AI编程」热潮。推特創始人杰克·多爾西(Jack Dorsey)、爆火Agent應用Perplexity CEO?阿拉溫德·斯里尼瓦斯(Aravind Srinivas)、著名風投公司a16z合伙人馬克·馬斯克羅(Marco Mascorro)等硅谷大咖盛贊Qwen3-Coder,HuggingFace CEO?克萊門特·德朗格(Clement Delangue)更是連轉帶發12條推文,向全球開發者力薦這一最好的編程模型。海外知名模型API聚合平臺OpenRouter數據顯示,阿里千問API調用量暴漲,過去幾天已突破1000億Tokens,在OpenRouter趋势榜上包揽全球前三,是当下最热门的模型。

阿里AI三连发,连夺三项第一!

?截至目前,阿里巴巴已開源300余款通義大模型,通義千問衍生模型突破14萬個,超越Meta的Llama系列成為全球第一的開源模型家族,通義也是開發者和企業使用最廣泛的大模型。未來三年,阿里巴巴還將投入超過3800億元用于建設云和AI硬件基礎設施,持續升級全棧AI能力,為中國和全球開發者和企業提供更先進的模型和云計算服務。

?